Der Entwickler Prachi Modi hat FluidVoice in der Version 1.5.8 mit mehreren Optimierungen und Verbesserungen veröffentlicht. Das quelloffene, kostenlose FluidVoice ermöglicht Diktate in fast jedes Programm und das Transkribieren von Audiodateien basierend auf dem Nvidia-Spracherkennungsmodell Parakeet TDT v3 (Apple-Silicon-Macs) bzw. Whisper (Intel-Macs).
Zu den Neuerungen teilte Modi mit: "Bessere Overlay-Erfahrung mit übersichtlicherem Layout und weniger Unordnung. Verbesserte Stabilität während des Diktierens, insbesondere bei Verwendung von benutzerdefiniertem Vokabular. Einfachere Wiederherstellungstools: schnellere Fehlermeldung und verbesserte Rollback-Optionen. Vocabulary Boosting ist jetzt optional (standardmäßig deaktiviert), während Instant Replacement weiterhin wie gewohnt funktioniert. Neue Einstellung: Blenden Sie FluidVoice aus dem Dock und Cmd+Tab aus, wenn Sie eine reine Menüleistenkonfiguration wünschen."
Das ab macOS Monterey 12 lauffähige FluidVoice arbeitet vollständig lokal und offline. Die Versionsanmerkungen mit allen Änderungen sind, mitsamt Downloads und Quellcode, auf GitHub zu finden. Auch Apples Spracherkennungsmodell (benötigt macOS Tahoe 26) wird unterstützt.

Bild: Prachi Modi.
"Auf Apple Silicon Macs nutzt FluidVoice CoreML für die Beschleunigung neuronaler Netzwerke und Metal für GPU-Computing. Dies ermöglicht eine Transkription mit extrem geringer Latenz (unter 100 ms), minimalem Batterieverbrauch und Echtzeitverarbeitung ohne Cloud-Abhängigkeit", erläutert der Autor. Es handelt sich dabei um ein junges Projekt, das erst im vergangenen Herbst startete.
FluidVoice bietet eine optionale KI-Nachbearbeitung, ermöglicht auch das Steuern des Rechners und lässt sich über ein anpassbares Tastaturkürzel global aufrufen, außerdem steht ein systemweites Menü zur Verfügung. Es werden mehr als 25 Sprachen unterstützt, wie zum Beispiel Chinesisch, Deutsch, Englisch, Französisch, Italienisch, Japanisch, Portugiesisch und Spanisch. Anwender können via GitHub wie gewohnt Problemberichte und Verbesserungsvorschläge für FluidVoice veröffentlichen.
"Fluid ist für immer völlig kostenlos, ohne Abonnementgebühren. Im Gegensatz zu anderen Sprach-zu-Text-Apps, die monatliche Gebühren erheben, verarbeitet Fluid alles lokal auf Ihrem Mac, ohne dass laufende Kosten anfallen. Fluid verarbeitet alle Spracherkennungen lokal auf Ihrem Mac mithilfe des Parakeet-Modells von Nvidia. Es ist keine Internetverbindung erforderlich, sodass auch ohne WLAN vollständige Privatsphäre und Zuverlässigkeit gewährleistet sind", so der Entwickler weiter.
